Cet article date de plus d'un an.

On vous explique comment marchent Midjourney, Lensa ou ChatGPT, ces outils d'intelligence artificielle sources de prouesses techniques (et d'inquiétudes)

Vincent Matalon

France Télévisions

Publié le 07/01/2023 07:05 Mis à jour le 07/01/2023 17:16

Temps de lecture : 11min

Une image générée à l'aide de la phrase "A female illustrator creates an image on a computer to illustrate a story about the progress of AI in art, hyperrealistic" par l'intelligence artificielle Midjourney. (MIDJOURNEY / FRANCEINFO)

Les services faisant appel à l'intelligence artificielle se sont démocratisés lors des derniers mois. Ils ouvrent de nombreuses possibilités, mais soulèvent plusieurs enjeux éthiques.

Art, informatique, rédaction… Et si les robots étaient sur le point de s'immiscer dans notre quotidien ? La deuxième moitié de l'année 2022 a été marquée par un vif engouement autour de services utilisant l'intelligence artificielle (IA). C'est que les progrès réalisés ces derniers mois sont saisissants : sans connaissances scientifiques particulières, il est désormais possible de créer en quelques minutes de superbes œuvres à partir d'une simple phrase, de confectionner une collection d'avatars stylisés à partir de selfies, ou encore de discuter des heures avec un robot incollable sur un nombre presque infini de sujets.

Dall-E, Midjourney, Lensa, ChatGPT… Que vous ayez ou non entendu parler de ces logiciels, parfois payants, franceinfo vous donne quelques clés pour vous frotter aux derniers progrès en matière d'IA. Et pour comprendre en quoi leur démocratisation soulève de nombreuses questions.

Les services de génération d'images et d'œuvres d'art

En quoi cela consiste-t-il ? Si vous vous sentez une âme d'artiste mais n'avez jamais réussi à tenir un pinceau, la technologie peut désormais vous aider. Midjourney*, Dall-E, Stable Diffusion*… Plusieurs services mis en ligne ces derniers mois permettent de créer en quelques secondes des images réalistes ou fantaisistes à partir d'une simple phrase. La plupart sont gratuits dans le cadre d'un essai, avec possibilité d'abonnement pour une utilisation plus intensive.

Comment essayer cette technologie ? Certains systèmes sont plus évidents à utiliser que d'autres. Pour tester la version beta de Midjourney, vous devrez ainsi passer par la messagerie Discord*. Stable Diffusion est un logiciel libre*, mais nécessite un ordinateur puissant pour être exécuté. Le plus accessible est sans aucun doute Dall-E. Pour vous y essayer, rendez-vous sur le site de son créateur, OpenAI*, créez un compte, puis décrivez précisément, en anglais, l'image que vous imaginez. Vous pouvez également préciser le style dans lequel doit être réalisée l'œuvre, ainsi que le niveau de détail attendu.

De quoi ces systèmes sont-ils capables ? Voici ce que propose Dall-E lorsqu'on lui demande d'imaginer une peinture inspirée de la Renaissance, dans laquelle une foule d'individus captivés par leur smartphone ne remarque pas une série d'explosions en arrière-plan.

Une image créée avec le système Dall-E 2 selon les instructions suivantes : "A crowd of individuals staring at their phones, not noticing huge explosions in the background, in a renaissance style painting, high details" (DALL-E 2 / FRANCEINFO)

Dans un autre style, voici le résultat produit par Midjourney lorsqu'on lui demande d'imaginer une scène "d'art numérique" dans laquelle un vieil homme noir joue aux échecs avec un enfant dans un parc new-yorkais, au coucher du soleil.

Une image créée avec le système Midjourney selon les instructions suivantes : "A black old male playing chess with a child in a NYC park, at sunset, digital art, 4k" (MIDJOURNEY / FRANCEINFO)

Comment ces technologies fonctionnent-elles ? Pour arriver à de tels résultats, ces logiciels ont été entraînés en analysant des quantités astronomiques d'images accompagnées d'une description écrite. Dall-E et Midjourney n'ont pas rendu publics les ensembles de données qui ont servi à les entraîner, tandis que Stable Diffusion se base sur le jeu de données de l'organisme allemand Laion*. A l'aide d'un système d'apprentissage automatisé inspiré du fonctionnement du cerveau humain – on parle de réseau de neurones artificiels –, le système arrive peu à peu à comprendre les récurrences entre les différentes images, à les reproduire, puis à les combiner.

Pourquoi sont-elles critiquées ? Les plus vives controverses concernent la propriété intellectuelle, ces logiciels étant entraînés sur des œuvres qui ne sont pas nécessairement libres de droits. Invoquant des risques de plagiat et des craintes liées aux droits d'auteur, l'agence Getty Images a ainsi interdit de mettre en vente sur sa plateforme des images générées par l'IA, rapporte le site spécialisé The Verge*. Ces logiciels sont également accusés d'entretenir des stéréotypes sexistes ou raciaux. Dans une précédente version, le logiciel Dall-E n'associait que des images d'hommes blancs au terme "PDG", et que des femmes au terme "secrétaire", écrit Vice*.

Les générateurs d'avatars stylisés

En quoi cela consiste-t-il ? Une autre tendance a émergé ces derniers mois : transformer sa photo de profil sur les réseaux sociaux en avatar stylisé qui semble sorti d'un comics, d'un manga ou d'un album photos d'avant-guerre.

Comment essayer cette technologie ? Les deux principales applications présentes sur ce secteur sont américaine (Lensa*) et israélienne (AI Time Machine*). Elles sont toutes deux payantes. Dans les deux cas, il faut fournir à l'IA une dizaine de selfies ou d'autoportraits en pied afin de "nourrir" l'algorithme et de l'entraîner à fournir une représentation cohérente de votre personne. Quelques minutes plus tard, le système vous propose une galerie de portraits automatisés.

De quoi ces systèmes sont-ils capables ? Lensa se spécialise dans les avatars artistiques ou qui semblent tirés d'univers fantastiques, tandis qu'AI Time Machine crée des portraits imaginaires à différentes périodes historiques. Cette dernière est éditée par MyHeritage, une société spécialisée dans la généalogie.

Comment ces technologies fonctionnent-elles ? Les deux systèmes proposent des avatars inspirés d'un gigantesque jeu d'œuvres originales obtenues en scannant les fichiers disponibles sur internet. Lensa utilise d'ailleurs la technologie de Stable Diffusion pour proposer ses portraits artistiques, et AI Time Machine le système d'Astria, un autre acteur du milieu.

Pourquoi sont-elles critiquées ? Comme les IA génératrices d'images, celles-ci ont tendance à entretenir les stéréotypes physiques issus des données dont elles ont été abreuvées. Sur le site MIT Technology Review*, la journaliste Melissa Heikkilä raconte comment, en essayant Lensa, elle a reçu de nombreux portraits érotiques ou dénudés, dans lesquels les traits asiatiques de son visage étaient accentués. Un résultat qui s'explique par l'importante quantité d'images sexualisées mettant en scène des femmes asiatiques dans la base de données utilisée par l'application. La journaliste avait d'ailleurs remarqué, dans un article publié en septembre, que le mot-clé "asiatique" ne renvoyait pratiquement qu'à du contenu pornographique dans l'ensemble de données de Stable Diffusion, sur lequel est basé Lensa.

Des utilisateurs ont également fait part de leurs inquiétudes en matière d'utilisation de leurs données personnelles par ces applications. Les acteurs du secteur se veulent toutefois rassurants : les conditions d'utilisation de MyHeritage, comme celles de Lensa*, précisent que les photos importées comme les avatars créés ne sont partagés avec aucun tiers, et ne sont pas utilisés pour améliorer les algorithmes d'IA.

Le logiciel qui donne l'impression de discuter avec un humain

En quoi cela consiste-t-il ? En la matière, un logiciel supplante tous les autres, tant ses fonctionnalités impressionnent. ChatGPT, créé par OpenAI et mis en ligne fin novembre, se présente comme un programme de chat avec une IA capable de répondre à vos requêtes avec un naturel déroutant qui donne l'impression de converser avec un humain.

En quelques secondes, le logiciel formule des paragraphes argumentés sur n'importe quel sujet, sans fautes et dans huit langues (français, anglais, espagnol, allemand, japonais, chinois, russe et néerlandais). Ses réponses peuvent même faire référence aux précédents messages de la discussion. Le succès de ChatGPT a été immédiat : cinq jours après sa mise en ligne, le programme comptait un million d'utilisateurs, plastronnait le président d'OpenAI sur Twitter.

Comment l'essayer ? Il faut créer un compte sur le site d'OpenAI*. La démarche est gratuite, mais il est nécessaire d'associer un numéro de téléphone à son compte. Vous pouvez également préciser lors de l'inscription que vous souhaitez utiliser les outils d'OpenAI à des fins personnelles. Une fois sur le site de ChatGPT, tapez votre message en français, comme si vous vous adressiez à un humain, dans la barre située en bas de page. Vous pouvez poser une question. En quelques secondes, le logiciel affiche une réponse.

De quoi ce système est-il capable ? Les possibilités ouvertes par ChatGPT donnent le tournis. Vous manquez d'inspiration pour un repas ? N'hésitez pas à mettre le logiciel au défi avec une requête très précise : en lui demandant par exemple une recette végane d'inspiration soudanaise avec un budget maximal de cinq euros par convive. ChatGPT livre les différentes étapes pour réaliser un curry de pois chiches.

Le programme est également capable de traduire et résumer un document en langue étrangère, ou de rédiger des textes originaux. Voici par exemple ce que le logiciel arrive à générer en quelques secondes lorsqu'on lui demande d'écrire un morceau de gangsta rap chantant les louanges de franceinfo.fr, en insistant sur le fait que les caïds les plus redoutés du milieu ne jurent que par cette source d'information.

Un exemple de texte composé par ChatGPT à partir d'une instruction fantasiste. (CHATGPT / FRANCEINFO)

ChatGPT est enfin capable d'écrire du code informatique (il connaît notamment les langages Java, Python, C++, ou JavaScript), d'y identifier et de corriger d'éventuelles erreurs, en expliquant sa démarche.

Comment cette technologie fonctionne-t-elle ? ChatGPT est la déclinaison "conversationnelle" de GPT-3, un programme de traitement du langage développé par OpenAI depuis le printemps 2020. Entraîné sur environ 8 millions de documents, soit 175 milliards de mots (c'est ce qu'indique ChatGPT lorsqu'on lui pose la question), GPT-3 utilise un réseau de neurones artificiels pour imiter le style et la structure de l'écriture humaine. ChatGPT n'effectue pas de recherches sur internet pour répondre aux requêtes. Il se base sur les textes sur lesquels il a été entraîné, qui datent de 2021 au plus tard. Il est donc incapable de s'épancher sur une actualité récente.

Pourquoi est-elle critiquée ? Consciente que son outil pouvait être utilisé à des fins malveillantes, OpenAI l'a limité. Impossible par exemple de glaner auprès de ChatGPT des conseils pour assassiner son voisin sans laisser de traces, ou de lui demander de justifier des discriminations fondées sur l'origine ou la sexualité des individus.

Des utilisateurs ont toutefois rapidement démontré que ces précautions pouvaient être contournées. Un Français a ainsi réussi à faire écrire à ChatGPT une recette pour fabriquer une bombe artisanale. Cette erreur semble depuis avoir été corrigée.

Si l'envie de jouer avec les limites du programme vous titille, sachez également que les conditions d'utilisation* de ChatGPT autorisent les équipes d'OpenAI à lire le contenu de vos échanges et à les utiliser pour améliorer la robustesse du système.

* Les liens suivis d'un astérisque sont en anglais.